OpenFoodFacts / Santé publique France¶

Objectif : améliorer la santé des concitoyens

  • informer les citoyens sur les produits les plus gras,salés, sucrés
  • trouver les produits les plus sains

Questions¶

  1. Quelles sont les catégories de produits ?
  2. Quels sont les produits les plus sucrés ? salés ? gras ? protéinés ?
  3. Quels sont les produits à la fois gras et salés ?
  4. Quels sont les produits les plus mauvais pour la santé ?
  5. Quels sont les produits riches en vitamines ?
  6. Quels sont les produits bon pour la santé au petit déjeuner ?
  7. Quelles sont les boissons saines ?
  8. Quels produits pour se faire plaisir avec du chocolat sain ?
  9. Y'a t-il de bons plats préparés ?
  10. Quelle est l'offre en pâtes Bio bon pour la santé ?
  11. Quels sont les laits Bio bon pour la santé ?

Setup pandas¶

Un peu de configuration pour l'affichage avec pandas

Setup Matplotlib¶

Quelques parametrages pour matplotlib

Lecture du fichier¶

Commençons par lire notre fichier CSV :

  • Séparateur : tabulation
  • Spécification des colonnes de type date
(320772, 162)

320k lignes et 162 colonnes

code url creator created_t created_datetime last_modified_t last_modified_datetime product_name generic_name quantity packaging packaging_tags brands brands_tags categories ... chromium_100g molybdenum_100g iodine_100g caffeine_100g taurine_100g ph_100g fruits-vegetables-nuts_100g collagen-meat-protein-ratio_100g cocoa_100g chlorophyl_100g carbon-footprint_100g nutrition-score-fr_100g nutrition-score-uk_100g glycemic-index_100g water-hardness_100g
count 3.207490e+05 320749 320770 3.207690e+05 320763 3.207720e+05 320772 303010 52795 104819 78960 78961 292360 292352 84410 ... 20.000000 11.000000 259.000000 78.000000 29.000000 49.000000 3036.000000 165.000000 948.000000 0.0 268.000000 221210.000000 221210.000000 0.0 0.0
unique 3.206380e+05 320749 3535 1.896360e+05 189568 1.806390e+05 180495 221347 38584 13826 14547 12064 58784 50253 36982 ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
top 7.065080e+10 http://world-fr.openfoodfacts.org/produit/7610800017851/qualite-prix-ravioli... usda-ndb-import 1.489077e+09 2017-03-09T16:32:00Z 1.439142e+09 2015-08-09T17:35:42Z Ice Cream Pâtes alimentaires au blé dur de qualité supérieure 500 g Carton sachet,plastique Carrefour carrefour Snacks sucrés,Biscuits et gâteaux,Biscuits ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
freq 2.000000e+00 1 169868 2.000000e+01 20 3.300000e+01 33 410 201 4669 2153 3959 2978 3149 301 ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
mean NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.001690 0.000401 0.000427 1.594563 0.145762 6.425698 31.458587 15.412121 49.547785 NaN 341.700764 9.165535 9.058049 NaN NaN
std NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.006697 0.001118 0.001285 6.475588 0.172312 2.047841 31.967918 3.753028 18.757932 NaN 425.211439 9.055903 9.183589 NaN NaN
min NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.000007 0.000005 0.000000 0.000000 0.001800 0.000000 0.000000 8.000000 6.000000 NaN 0.000000 -15.000000 -15.000000 NaN NaN
25% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.000011 0.000020 0.000015 0.015500 0.035000 6.300000 0.000000 12.000000 32.000000 NaN 98.750000 1.000000 1.000000 NaN NaN
50% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.000024 0.000039 0.000034 0.021000 0.039000 7.200000 23.000000 15.000000 50.000000 NaN 195.750000 10.000000 9.000000 NaN NaN
75% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.000068 0.000075 0.000103 0.043000 0.400000 7.400000 51.000000 15.000000 64.250000 NaN 383.200000 16.000000 16.000000 NaN NaN
max NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... 0.030000 0.003760 0.014700 42.280000 0.423000 8.400000 100.000000 25.000000 100.000000 NaN 2842.000000 40.000000 40.000000 NaN NaN

11 rows × 162 columns

Traitement du jeu de données¶

Suppression des données inutiles¶

On enlève la redondance date time et timestamp.

La grande image n'est pas très utile dans notre cas pour prévisualiser les images.

On supprime la plus grande.

On supprime les portions qui contiennent des valeurs très hétérogênes

Le score anglais ne nous est pas utile

Produits vendus en france¶

81145  produits restants pour les produits vendus en France

Retrait des doublons sur le code¶

Analysons si nous avons des doublons sur les codes produits

81143

Inspectons ces lignes

code creator created_datetime product_name brands categories
9892 11778 beniben 2016-09-21T20:19:09Z All Butter Reduced Fat Stem Ginger Cookies Marks & Spencer Snacks sucrés,Biscuits et gâteaux,Biscuits,Cookies,Cookies au gingembre
458 11778 gildubs 2017-03-31T15:58:35Z Stem Ginger Cookies Marks & Spencer Cookies
67371 635646 date-limite-app 2015-02-14T12:19:51Z M&S Vegetable pizza Marks & Spencer Vegetable pizzas
120240 635646 beniben 2016-09-22T05:15:44Z Chargrilled Vegetable & Basil Pesto Marks & Spencer Plats préparés,Pizzas tartes salées et quiches,Pizzas,Pizzas aux légumes gri...

Peu de doublons sur les produits français (seulement 4) Sur ces doublons, 1 produit en double et une erreur.

81141  Lignes après traitement des codes en double

Retrait des colonnes vides¶

Certaines colonnes sont vides... Sans valeurs... Ou toutes égales à 0...

Serie :  cities  has no values
Serie :  allergens_fr  has no values
Serie :  no_nutriments  has no values
Serie :  ingredients_from_palm_oil  has no values
Serie :  butyric-acid_100g  has no values
Serie :  caproic-acid_100g  has no values
Serie :  caprylic-acid_100g  has no values
Serie :  capric-acid_100g  has no values
Serie :  myristic-acid_100g  has no values
Serie :  palmitic-acid_100g  has no values
Serie :  stearic-acid_100g  has no values
Serie :  behenic-acid_100g  has no values
Serie :  lignoceric-acid_100g  has no values
Serie :  cerotic-acid_100g  has no values
Serie :  melissic-acid_100g  has no values
Serie :  dihomo-gamma-linolenic-acid_100g  has no values
Serie :  elaidic-acid_100g  has no values
Serie :  gondoic-acid_100g  has no values
Serie :  mead-acid_100g  has no values
Serie :  erucic-acid_100g  has no values
Serie :  nervonic-acid_100g  has no values
Serie :  chlorophyl_100g  has no values
Serie :  glycemic-index_100g  has no values
Serie :  water-hardness_100g  has no values

Traitement des NaN¶

On va remplacer les NaN par des valeurs recherchées selon un champ (catégorie de produits etc.)

Exemple : J'ai un produit apéritif ou j'ai un NaN sur le sel... Je remplace par la moyenne du sel de cette catégorie

Pour être précis il faut être le plus granulaire possible sur le choix de la colonne... (grande cardinalité)

On teste notre fonction sur un jeu de donnée dédié...

  categories_fr  sugar
0       dessert  150.0
1        entree    0.0
2          plat    5.0
3        entree    0.0
4       dessert  200.0
5       dessert   71.0
6        entree   71.0
7          plat   71.0
8         apero   71.0
  categories_fr  sugar
0       dessert  150.0
1        entree    0.0
2          plat    5.0
3        entree    0.0
4       dessert  200.0
5       dessert  175.0
6        entree    0.0
7          plat    5.0
8         apero    NaN

Recherche d'une colonne crédible pour l'attribution de la moyenne... cad...

avec une cardinalité importante... Le but est d'être le plus précis possible

count        61675
unique        1583
top       Boissons
freq          4429
Name: main_category_fr, dtype: object
count            61675
unique            1583
top       en:beverages
freq              4429
Name: main_category, dtype: object
count                                          61698
unique                                         26450
top       Snacks sucrés,Biscuits et gâteaux,Biscuits
freq                                             292
Name: categories, dtype: object
count                                          61698
unique                                         15539
top       Snacks sucrés,Biscuits et gâteaux,Biscuits
freq                                             576
Name: categories_fr, dtype: object
d    16904
c    13103
e    11708
a    10171
b     9155
Name: nutrition_grade_fr, dtype: int64
19466
19466
19443
19443
20100

Energie (en kJ)¶

count    6.417100e+04
mean     1.170203e+03
std      1.287786e+04
min      0.000000e+00
25%      4.270000e+02
50%      1.033000e+03
75%      1.648000e+03
max      3.251373e+06
Name: energy_100g, dtype: float64

On va regarder si nous avons beaucoup de "not a number"

16970

Attribution de la valeur moyenne

Tests si tout est correct

On fait de même avec la colonne energy-from-fat_100g

Composition pour 100g¶

recherche de valeurs abberantes, de particularités les champs terminants par "_100g" contiennent des quantités exprimées pour 100g et 100ml la recherche de valeurs abbérantes doit d'effectuer en recherchant la densité maximale pour 100ml et en déduire une limite haute de poids.

Column: energy_100g
count    6.417100e+04
mean     1.170203e+03
std      1.287786e+04
min      0.000000e+00
25%      4.270000e+02
50%      1.033000e+03
75%      1.648000e+03
max      3.251373e+06
Name: energy_100g, dtype: float64
Column: energy-from-fat_100g
count      30.000000
mean      547.471667
std       574.728341
min         0.000000
25%        62.900000
50%       208.500000
75%       881.500000
max      1830.000000
Name: energy-from-fat_100g, dtype: float64
Column: fat_100g
count    47215.000000
mean        13.307764
std         16.929266
min          0.000000
25%          1.300000
50%          6.800000
75%         21.000000
max        380.000000
Name: fat_100g, dtype: float64
Column: saturated-fat_100g
count    61993.000000
mean         5.416004
std          8.542337
min          0.000000
25%          0.300000
50%          1.960000
75%          7.400000
max        210.000000
Name: saturated-fat_100g, dtype: float64
Column: lauric-acid_100g
count     1.0
mean     49.0
std       NaN
min      49.0
25%      49.0
50%      49.0
75%      49.0
max      49.0
Name: lauric-acid_100g, dtype: float64
Column: arachidic-acid_100g
count    1.000
mean     0.064
std        NaN
min      0.064
25%      0.064
50%      0.064
75%      0.064
max      0.064
Name: arachidic-acid_100g, dtype: float64
Column: montanic-acid_100g
count     1.0
mean     61.0
std       NaN
min      61.0
25%      61.0
50%      61.0
75%      61.0
max      61.0
Name: montanic-acid_100g, dtype: float64
Column: monounsaturated-fat_100g
count    1161.000000
mean       18.692989
std        22.068921
min         0.000000
25%         2.600000
50%         9.100000
75%        26.000000
max        82.000000
Name: monounsaturated-fat_100g, dtype: float64
Column: polyunsaturated-fat_100g
count    1192.000000
mean        9.839218
std        15.038546
min         0.000000
25%         1.500000
50%         3.500000
75%        11.000000
max        75.000000
Name: polyunsaturated-fat_100g, dtype: float64
Column: omega-3-fat_100g
count    654.000000
mean       3.132448
std        4.938521
min        0.000500
25%        0.900000
50%        1.990000
75%        3.300000
max       60.000000
Name: omega-3-fat_100g, dtype: float64
Column: alpha-linolenic-acid_100g
count    176.000000
mean       2.110744
std        7.980249
min        0.000000
25%        0.066750
50%        0.112500
75%        0.562500
max       75.000000
Name: alpha-linolenic-acid_100g, dtype: float64
Column: eicosapentaenoic-acid_100g
count    19.000000
mean      5.066421
std      19.361460
min       0.196000
25%       0.200000
50%       0.600000
75%       1.010000
max      85.000000
Name: eicosapentaenoic-acid_100g, dtype: float64
Column: docosahexaenoic-acid_100g
count    39.000000
mean      0.537154
std       0.611780
min       0.044000
25%       0.126000
50%       0.381000
75%       0.850000
max       3.200000
Name: docosahexaenoic-acid_100g, dtype: float64
Column: omega-6-fat_100g
count    144.000000
mean      18.017375
std       18.469462
min        0.050000
25%        3.975000
50%       11.500000
75%       24.300000
max       71.000000
Name: omega-6-fat_100g, dtype: float64
Column: linoleic-acid_100g
count    144.000000
mean       3.764229
std        6.457791
min        0.199000
25%        0.438500
50%        0.643500
75%        3.600000
max       25.000000
Name: linoleic-acid_100g, dtype: float64
Column: arachidonic-acid_100g
count    8.000000
mean     0.057000
std      0.025534
min      0.007000
25%      0.046250
50%      0.061000
75%      0.068500
max      0.090000
Name: arachidonic-acid_100g, dtype: float64
Column: gamma-linolenic-acid_100g
count    1.000
mean     0.095
std        NaN
min      0.095
25%      0.095
50%      0.095
75%      0.095
max      0.095
Name: gamma-linolenic-acid_100g, dtype: float64
Column: omega-9-fat_100g
count    19.000000
mean     43.960526
std      23.360155
min       1.000000
25%      27.050000
50%      39.000000
75%      68.400000
max      75.000000
Name: omega-9-fat_100g, dtype: float64
Column: oleic-acid_100g
count     8.000000
mean     32.868750
std      28.925902
min       6.900000
25%      10.212500
50%      18.550000
75%      57.775000
max      76.000000
Name: oleic-acid_100g, dtype: float64
Column: trans-fat_100g
count    341.000000
mean       0.229513
std        1.044663
min        0.000000
25%        0.000000
50%        0.000000
75%        0.180000
max       17.200000
Name: trans-fat_100g, dtype: float64
Column: cholesterol_100g
count    383.000000
mean       0.043310
std        0.557667
min        0.000000
25%        0.000000
50%        0.000000
75%        0.004900
max       10.900000
Name: cholesterol_100g, dtype: float64
Column: carbohydrates_100g
count    46786.000000
mean        27.677282
std         27.399357
min          0.000000
25%          4.000000
50%         14.400000
75%         53.000000
max        190.000000
Name: carbohydrates_100g, dtype: float64
Column: sugars_100g
count    62116.000000
mean        13.396699
std         19.072548
min         -0.100000
25%          1.000000
50%          4.000000
75%         17.600000
max        105.000000
Name: sugars_100g, dtype: float64
Column: sucrose_100g
count    13.000000
mean     10.492308
std      25.892517
min       0.000000
25%       0.200000
50%       0.300000
75%       3.100000
max      92.800000
Name: sucrose_100g, dtype: float64
Column: glucose_100g
count     6.000000
mean      5.916667
std       8.945036
min       0.100000
25%       0.975000
50%       1.600000
75%       6.575000
max      23.200000
Name: glucose_100g, dtype: float64
Column: fructose_100g
count     24.000000
mean      34.125000
std       31.476344
min        0.100000
25%        2.850000
50%       27.000000
75%       56.325000
max      101.000000
Name: fructose_100g, dtype: float64
Column: lactose_100g
count    133.00000
mean      10.09391
std       18.72465
min        0.00000
25%        0.00000
50%        0.01000
75%        8.00000
max       74.50000
Name: lactose_100g, dtype: float64
Column: maltose_100g
count     4.000000
mean     24.325000
std      17.793515
min       0.100000
25%      16.525000
50%      29.000000
75%      36.800000
max      39.200000
Name: maltose_100g, dtype: float64
Column: maltodextrins_100g
count    11.000000
mean     12.163636
std       8.372129
min       1.500000
25%       5.400000
50%      13.500000
75%      16.950000
max      27.500000
Name: maltodextrins_100g, dtype: float64
Column: starch_100g
count    171.000000
mean      37.730702
std       23.985044
min        0.000000
25%       15.850000
50%       39.000000
75%       60.250000
max       77.000000
Name: starch_100g, dtype: float64
Column: polyols_100g
count    299.000000
mean      50.320736
std       33.677323
min        0.000000
25%       17.450000
50%       59.900000
75%       71.000000
max      100.000000
Name: polyols_100g, dtype: float64
Column: fiber_100g
count    45460.000000
mean         2.552430
std          4.621193
min          0.000000
25%          0.000000
50%          1.300000
75%          3.200000
max        178.000000
Name: fiber_100g, dtype: float64
Column: proteins_100g
count    63892.000000
mean         7.757058
std          7.885581
min          0.000000
25%          1.800000
50%          6.000000
75%         11.000000
max        100.000000
Name: proteins_100g, dtype: float64
Column: casein_100g
count    27.000000
mean      4.658148
std       2.976340
min       0.920000
25%       2.150000
50%       4.200000
75%       7.100000
max      10.700000
Name: casein_100g, dtype: float64
Column: serum-proteins_100g
count    15.000000
mean      2.540000
std       2.259203
min       0.300000
25%       0.300000
50%       1.900000
75%       4.900000
max       5.800000
Name: serum-proteins_100g, dtype: float64
Column: nucleotides_100g
count    9.000000
mean     0.021678
std      0.003072
min      0.015500
25%      0.021600
50%      0.022000
75%      0.024000
max      0.025000
Name: nucleotides_100g, dtype: float64
Column: salt_100g
count    62175.000000
mean         1.156547
std          4.265864
min          0.000000
25%          0.080000
50%          0.560000
75%          1.244600
max        211.000000
Name: salt_100g, dtype: float64
Column: sodium_100g
count    62172.000000
mean         0.455354
std          1.679455
min          0.000000
25%          0.031496
50%          0.220472
75%          0.490000
max         83.000000
Name: sodium_100g, dtype: float64
Column: alcohol_100g
count    2415.000000
mean        9.144612
std        10.621150
min         0.000000
25%         1.000000
50%         6.000000
75%        12.500000
max        69.000000
Name: alcohol_100g, dtype: float64
Column: vitamin-a_100g
count    556.000000
mean       0.048680
std        1.132319
min        0.000000
25%        0.000065
50%        0.000122
75%        0.000500
max       26.700000
Name: vitamin-a_100g, dtype: float64
Column: beta-carotene_100g
count    12.000000
mean      1.313793
std       4.310932
min       0.000812
25%       0.003820
50%       0.033000
75%       0.155000
max      15.000000
Name: beta-carotene_100g, dtype: float64
Column: vitamin-d_100g
count    585.000000
mean       0.000005
std        0.000018
min        0.000000
25%        0.000001
50%        0.000002
75%        0.000005
max        0.000376
Name: vitamin-d_100g, dtype: float64
Column: vitamin-e_100g
count    786.000000
mean       0.052547
std        0.633852
min        0.000000
25%        0.001800
50%        0.005500
75%        0.012000
max       12.700000
Name: vitamin-e_100g, dtype: float64
Column: vitamin-k_100g
count    72.000000
mean      0.000517
std       0.003939
min       0.000003
25%       0.000004
50%       0.000010
75%       0.000036
max       0.033400
Name: vitamin-k_100g, dtype: float64
Column: vitamin-c_100g
count    1261.000000
mean        0.128892
std         2.839904
min         0.000000
25%         0.012000
50%         0.020000
75%         0.030000
max       100.000000
Name: vitamin-c_100g, dtype: float64
Column: vitamin-b1_100g
count    846.000000
mean       0.303364
std        6.382273
min        0.000000
25%        0.000323
50%        0.000625
75%        0.000930
max      161.000000
Name: vitamin-b1_100g, dtype: float64
Column: vitamin-b2_100g
count    633.000000
mean       0.005135
std        0.062377
min        0.000000
25%        0.000300
50%        0.001100
75%        0.001200
max        1.370968
Name: vitamin-b2_100g, dtype: float64
Column: vitamin-pp_100g
count    695.000000
mean       0.068143
std        0.743117
min        0.000002
25%        0.003500
50%        0.009000
75%        0.013300
max       15.900000
Name: vitamin-pp_100g, dtype: float64
Column: vitamin-b6_100g
count    736.000000
mean       0.189385
std        3.657713
min        0.000000
25%        0.000307
50%        0.000840
75%        0.001200
max       92.600000
Name: vitamin-b6_100g, dtype: float64
Column: vitamin-b9_100g
count    676.000000
mean       0.002223
std        0.033350
min        0.000007
25%        0.000050
50%        0.000130
75%        0.000170
max        0.700000
Name: vitamin-b9_100g, dtype: float64
Column: folates_100g
count    1.000000
mean     0.000114
std           NaN
min      0.000114
25%      0.000114
50%      0.000114
75%      0.000114
max      0.000114
Name: folates_100g, dtype: float64
Column: vitamin-b12_100g
count    5.430000e+02
mean     7.431180e-04
std      1.716559e-02
min      0.000000e+00
25%      5.700000e-07
50%      1.700000e-06
75%      2.100000e-06
max      4.000000e-01
Name: vitamin-b12_100g, dtype: float64
Column: biotin_100g
count    1.910000e+02
mean     3.149573e-02
std      4.341393e-01
min      2.000000e-09
25%      4.500000e-06
50%      1.000000e-05
75%      2.500000e-05
max      6.000000e+00
Name: biotin_100g, dtype: float64
Column: pantothenic-acid_100g
count    4.170000e+02
mean     8.579762e-03
std      6.854579e-02
min      9.000000e-07
25%      9.000000e-04
50%      2.200000e-03
75%      5.100000e-03
max      9.230000e-01
Name: pantothenic-acid_100g, dtype: float64
Column: silica_100g
count    29.000000
mean      0.006579
std       0.009518
min       0.000008
25%       0.001500
50%       0.003170
75%       0.007100
max       0.036000
Name: silica_100g, dtype: float64
Column: bicarbonate_100g
count    54.000000
mean      0.141868
std       0.220059
min       0.000006
25%       0.030525
50%       0.037800
75%       0.148575
max       1.250000
Name: bicarbonate_100g, dtype: float64
Column: potassium_100g
count    329.000000
mean       0.931269
std        4.111197
min        0.000000
25%        0.027600
50%        0.221000
75%        0.625000
max       34.600000
Name: potassium_100g, dtype: float64
Column: chloride_100g
count    116.000000
mean       0.108737
std        0.163472
min        0.000003
25%        0.001480
50%        0.024000
75%        0.107250
max        0.589000
Name: chloride_100g, dtype: float64
Column: calcium_100g
count    2206.000000
mean        0.365664
std         2.268909
min         0.000000
25%         0.120000
50%         0.130000
75%         0.350000
max        69.500000
Name: calcium_100g, dtype: float64
Column: phosphorus_100g
count    559.000000
mean       0.287864
std        0.383565
min        0.000000
25%        0.159000
50%        0.230000
75%        0.350000
max        7.890000
Name: phosphorus_100g, dtype: float64
Column: iron_100g
count    1148.000000
mean        0.062430
std         0.955295
min         0.000000
25%         0.002500
50%         0.005300
75%         0.008000
max        25.000000
Name: iron_100g, dtype: float64
Column: magnesium_100g
count    808.000000
mean       0.236251
std        1.977323
min        0.000000
25%        0.045000
50%        0.098000
75%        0.155000
max       39.500000
Name: magnesium_100g, dtype: float64
Column: zinc_100g
count    230.000000
mean       0.017919
std        0.186187
min        0.000300
25%        0.000950
50%        0.002000
75%        0.005193
max        2.800000
Name: zinc_100g, dtype: float64
Column: copper_100g
count    116.000000
mean       0.328121
std        3.490852
min        0.000022
25%        0.000095
50%        0.000317
75%        0.000793
max       37.600000
Name: copper_100g, dtype: float64
Column: manganese_100g
count    108.000000
mean       0.017846
std        0.096645
min        0.000001
25%        0.000038
50%        0.000160
75%        0.001325
max        0.700000
Name: manganese_100g, dtype: float64
Column: fluoride_100g
count    64.000000
mean      0.002131
std       0.008058
min       0.000000
25%       0.000015
50%       0.000060
75%       0.000450
max       0.050000
Name: fluoride_100g, dtype: float64
Column: selenium_100g
count    9.100000e+01
mean     3.818560e-04
std      3.148658e-03
min      2.500000e-08
25%      4.600000e-06
50%      1.290000e-05
75%      2.425000e-05
max      3.000000e-02
Name: selenium_100g, dtype: float64
Column: chromium_100g
count    8.000000
mean     0.000406
std      0.001053
min      0.000008
25%      0.000020
50%      0.000024
75%      0.000059
max      0.003010
Name: chromium_100g, dtype: float64
Column: molybdenum_100g
count    4.000000
mean     0.000963
std      0.001865
min      0.000007
25%      0.000031
50%      0.000042
75%      0.000974
max      0.003760
Name: molybdenum_100g, dtype: float64
Column: iodine_100g
count    1.200000e+02
mean     3.526196e-04
std      8.892606e-04
min      7.500000e-07
25%      1.600000e-05
50%      5.500000e-05
75%      1.035000e-04
max      7.520000e-03
Name: iodine_100g, dtype: float64
Column: caffeine_100g
count    34.000000
mean      1.495912
std       5.749501
min       0.003000
25%       0.020000
50%       0.027000
75%       0.046250
max      33.300000
Name: caffeine_100g, dtype: float64
Column: taurine_100g
count    27.000000
mean      0.130522
std       0.168218
min       0.001800
25%       0.035000
50%       0.038000
75%       0.220500
max       0.423000
Name: taurine_100g, dtype: float64
Column: ph_100g
count    40.000000
mean      6.559910
std       1.672411
min       0.000000
25%       6.275000
50%       7.000000
75%       7.355000
max       8.400000
Name: ph_100g, dtype: float64
Column: fruits-vegetables-nuts_100g
count    2968.000000
mean       31.539006
std        32.051034
min         0.000000
25%         0.000000
50%        24.000000
75%        51.000000
max       100.000000
Name: fruits-vegetables-nuts_100g, dtype: float64
Column: collagen-meat-protein-ratio_100g
count    165.000000
mean      15.412121
std        3.753028
min        8.000000
25%       12.000000
50%       15.000000
75%       15.000000
max       25.000000
Name: collagen-meat-protein-ratio_100g, dtype: float64
Column: cocoa_100g
count    665.000000
mean      49.057594
std       19.231402
min        6.000000
25%       31.000000
50%       48.000000
75%       65.000000
max      100.000000
Name: cocoa_100g, dtype: float64
Column: carbon-footprint_100g
count     177.000000
mean      364.761044
std       402.902670
min         0.000000
25%       149.000000
50%       219.000000
75%       485.000000
max      2520.000000
Name: carbon-footprint_100g, dtype: float64
Column: nutrition-score-fr_100g
count    61041.000000
mean         8.665143
std          9.036843
min        -15.000000
25%          1.000000
50%          9.000000
75%         15.000000
max         40.000000
Name: nutrition-score-fr_100g, dtype: float64
Column: nutrition-score-uk_100g
count    61041.000000
mean         8.343556
std          9.376024
min        -15.000000
25%          0.000000
50%          7.000000
75%         16.000000
max         36.000000
Name: nutrition-score-uk_100g, dtype: float64
(81141, 116)

Replacement des nan par la moyenne

  • on fait une moyenne par type de produit
  • si toujours des nan -> moyenne générale (Axe d'amélioration : la mediane est moins sensible aux valeurs abbérantes)
count    81141.000000
mean         7.623815
std          7.881244
min          0.000000
25%          1.500000
50%          6.060000
75%         10.000000
max        100.000000
Name: proteins_100g, dtype: float64

Vérification des bornes min et max

Selon la base :

Base de données FAO/INFOODS sur la densité. Version 2.0(2015).

Pour 100ml le poids maximum est celui du sel avec 216gr pour 100ml

Je décide d'exclure ce produit qui n'est pas vertueux d'un point de vue alimentaire et utilise en borne haute la confiture (143gr)

Attention :Pas de clipping sur l'energie et le score

900k cal max pour les ingrédients les plus riches <==> 3765,6 Kj

count    8.114100e+04
mean     1.131437e+03
std      1.180631e+04
min      0.000000e+00
25%      4.317704e+02
50%      1.028521e+03
75%      1.584000e+03
max      3.251373e+06
Name: energy_100g, dtype: float64

Variables compteur (additifs, ingrédient a base huile)¶

Nutri score¶

On vérifie la validité des nutri scores

On attribue la valeur moyenne par défaut

array(['c', 'e', 'd', 'a', 'b'], dtype=object)
Text(0, 0.5, 'Nombre de produits')

Analyse¶

Catégories de produits¶

15540  catégories répertoriées
13
02k4k6k8k10k12k14kAliments et boissons à base de végétaux,Aliments dAliments et boissons à base de végétaux,Boissons,BSnacks sucrés,Biscuits et gâteaux,Biscuits,BiscuitSnacks sucrés,Biscuits et gâteaux,Desserts,GâteauxConserves,Produits de la mer,Poissons,Poissons en Produits à tartiner,Petit-déjeuners,Produits à tarAliments et boissons à base de végétaux,Boissons,ASnacks salés,Apéritif,Chips et frites,Chips,Chips Snacks sucrés,Biscuits et gâteaux,BiscuitsDesserts,Surgelés,Desserts glacés,Glaces et sorbetProduits laitiers,Fromages,Fromages de vache,FromaSnacks sucrés,Chocolats,Chocolats noirsSnacks sucrés,Confiseries,Bonbons
Nombre de produitsCatégories
plotly-logomark

Produits les plus sucrés¶

Pour 100g

count    81141.000000
mean        13.260914
std         18.409803
min          0.000000
25%          1.100000
50%          4.700000
75%         16.923766
max        105.000000
Name: sugars_100g, dtype: float64

Affichage de la distribution des produits contenant des sucres

0204060800500100015002000
xcount
plotly-logomark
020406080100
x
plotly-logomark
/home/smougel/anaconda2/envs/p3/lib/python3.6/site-packages/ipykernel_launcher.py:13: UserWarning:

Boolean Series key will be reindexed to match DataFrame index.

code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g carbohydrates_100g
239056 3560070659487 Boisson thé citron Boissons,Produits déshydratés,Produits lyophilisés à reconstituer,Boissons l... c E330 - Acide citrique 1615.0 92.0 1.278477 0.170000 29.460903 93.00
277436 5410001001442 Frappé Café glacé Boissons,Boissons chaudes,Cafés,Boissons chaudes instantanées,Cafés en poudr... e NaN 1627.0 89.4 0.100000 0.406400 29.460903 91.20
291618 7613032713041 Nestea Peach Boissons,Boissons édulcorées,Thés glacés e E330 - Acide citrique,E334 - Acide L-tartrique,E951 - Aspartame 1633.0 81.9 0.300000 0.000000 29.460903 90.00
208196 3251490481009 Cérécof, sans caféine, avec chicorée contenant de l'inuline Boissons,Boissons chaudes,Boissons chaudes instantanées,Boissons non sucrées e NaN 1548.0 7.2 0.000000 0.320000 29.460903 87.00
237106 3538280839333 Super Poulain Boissons,Boissons chaudes,Boissons chaudes instantanées,Boissons sucrées e E322 - Lécithines,E300 - Acide ascorbique,E101 - Riboflavine 1610.0 85.0 1.900000 0.000000 29.460903 87.00
241161 3564700022603 Cacao Morning Boissons,Boissons chaudes,Boissons chaudes instantanées,Boissons sucrées e E322 - Lécithines,E101 - Riboflavine,E375 - Acide nicotinique 1688.0 78.5 2.000000 0.163000 29.460903 87.00
193290 3092718611095 Sirop de cassis Boissons,Sirops,Sirops aromatisés,Sirops de cassis,Boissons non sucrées e NaN 1423.0 85.0 0.000000 0.010000 29.460903 86.80
279169 5411788003629 Yannoh Instant Original Boissons,Boissons chaudes,Cafés,Boissons non sucrées e NaN 368.0 7.0 0.100000 0.254000 29.460903 86.80
230481 3394540437608 Sirop de Verveine Boissons,Sirops,Sirops aromatisés,Boissons non sucrées,Sirops-de-verveine e E202 - Sorbate de potassium,E102 - Tartrazine,E131 - Bleu patenté V 1436.1 61.3 0.300000 0.012500 29.460903 85.89
193246 3092718605124 Sirop d'Orgeat Boissons,Sirops,Sirops aromatisés,Boissons non sucrées,Sirops d'orgeat c NaN 1454.0 85.5 1.278477 0.302847 29.460903 85.50

Produits energétiques¶

count    81141.000000
mean      1076.619137
std        754.349248
min          0.000000
25%        431.770378
50%       1028.520914
75%       1584.000000
max       3766.000000
Name: energy_100g, dtype: float64
05001000150020002500300035000500100015002000
energiecount
plotly-logomark
0500100015002000250030003500
energie
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g
204923 3250390001522 Sirop Grenadine - Recette William Boissons,Sirops,Sirops aromatisés,Sirops de grenadine,Boissons sucrées e E330 - Acide citrique 3766.0 73.5 0.05 0.0100 29.460903
315317 8716200707190 Coffee Whitener Boissons,Boissons chaudes,Cafés,Boissons chaudes instantanées,Cafés en poudr... e E340 - Orthophosphates de potassium,E452 - Polyphosphates,E471 - Mono- et di... 2320.0 10.0 35.00 0.5000 29.460903
299234 7622300822965 Cappuccino Boissons,Boissons chaudes,Cafés,Café en dosettes,Boissons non sucrées,Café e... e E1450 - Octényle succinate d'amidon sodique,E339 - Orthophosphates de sodium... 1925.0 45.0 17.00 1.2700 29.460903
282113 5900649052697 Cappuccino Gold Chocolate flavour Boissons,Boissons chaudes,Boissons sucrées e E340 - Orthophosphates de potassium 1888.0 50.7 12.70 0.0000 29.460903
292096 7613034339959 Nescafé 3 en 1 goût Café au Lait sucré Boissons,Boissons chaudes,Cafés,Boissons sucrées,Boissons-instantanees e E331 - Citrates de sodium,E340 - Orthophosphates de potassium,E452 - Polypho... 1879.0 57.0 13.00 0.9500 29.460903
292113 7613034389435 Nescafé® 3 en 1 - 18 g Boissons,Boissons chaudes,Boissons chaudes instantanées,Boissons sucrées e E331 - Citrates de sodium,E340 - Orthophosphates de potassium,E452 - Polypho... 1879.0 57.0 12.90 0.9652 29.460903
291543 7613032349523 Mocha Boissons,Boissons chaudes,Boissons non sucrées e E322 - Lécithines 1858.0 44.7 19.10 0.6096 29.460903
298600 7622210392725 Cappuccino saveur Noisettes Boissons,Boissons chaudes,Boissons non sucrées,Boissons sucrées,Boissons-ins... e E340 - Orthophosphates de potassium,E1450 - Octényle succinate d'amidon sodi... 1835.0 39.5 15.00 0.3300 29.460903
298601 7622210392749 Cappuccino saveur Biscuits Amandes Boissons,Boissons chaudes,Boissons non sucrées,Boissons sucrées,Boissons-ins... e E340 - Orthophosphates de potassium,E1450 - Octényle succinate d'amidon sodi... 1835.0 39.5 15.00 0.5000 29.460903
190861 3043933232701 Lait demi écrémé en poudre Boissons,Boissons non sucrées,en:Laits,en:Laits-en-poudre,en:Produits-laitiers e E322 - Lécithines,E300 - Acide ascorbique 1810.0 45.0 14.00 0.9200 29.460903

Produits les plus riches en vitamines¶

00.020.040.060.080.10.12050010001500200025003000350040004500
vitamin-a_100gcount
plotly-logomark
00.020.040.060.080.10.12
Nutri scorecebdaVitamines
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g vitamin-a_100g
238159 3560070362486 Multifruits, boisson Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... c E330 - Acide citrique,E300 - Acide ascorbique,E160a - Bêta-carotène,E950 - A... 29.0 1.100000 0.00 0.030000 29.460903 0.12000
202364 3229820108605 Jus de Carotte Bio Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... b NaN 141.0 6.500000 0.00 0.080000 29.460903 0.00108
201248 3222475308536 100 % Pur Jus Carotte Citron Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... e NaN 138.0 7.300000 0.10 0.130000 29.460903 0.00080
209302 3256220024068 Jus de carotte bio Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... b NaN 132.0 6.700000 0.00 0.080010 29.460903 0.00080
238894 3560070583379 Carotte, 100 % Pur Jus Pressé Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... b NaN 108.0 5.100000 0.50 0.050000 29.460903 0.00080
239695 3560070820627 Jus de carotte bio Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... b NaN 141.0 7.300000 0.00 0.100000 29.460903 0.00080
241465 3564700290224 Pur Jus Carotte Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... b NaN 109.0 5.100000 0.15 0.080000 29.460903 0.00080
194250 3109850018733 Concentré de réglisse pomme et cannelle Boissons,Boissons non sucrées c NaN 103.0 17.133333 1.00 0.066156 50.333333 0.00065
241849 3564700449301 Les Pressés Clémentine Boissons,Boissons non sucrées e NaN 188.0 10.000000 0.10 0.025400 50.333333 0.00065
250792 3700749300412 Ananas-Gingembre Reine des près Boissons,Boissons non sucrées e NaN 138.0 7.500000 0.10 0.030000 50.333333 0.00065

Répartition du score en fonction de l'energie et du sucre¶

02040608010005001000150020002500300035004000
Nutri-ScoreabcdeSucre (100g)Energie (100g)
plotly-logomark
500500100010001500150015000204060801000500100015002000250030003500
50010001500200025003000sugars_100genergy_100g
plotly-logomark

Produits gras¶

−10123456−101234
energy-from-fat_100gcount
plotly-logomark
−1−0.500.51
Nutri scoreabcdeenergy-from-fat_100g
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g energy-from-fat_100g
279009 5411188513513 Soya natural Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 147.0 0.1 2.1 0.040000 29.460903 0.0
278907 5411188092629 Soya vanille Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 228.0 5.7 1.9 0.140000 29.460903 0.0
278906 5411188091912 Alpro Soya Original Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E340i - Phosphate monopotassique,E340ii - Phosphate dipotassique,E170 - Carb... 167.0 2.7 1.8 0.059944 29.460903 0.0
278949 5411188115472 Soja original saveur douce Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E341 - Phosphate de calcium d'hydrogène,E340 - Orthophosphates de potassium,... 163.0 2.5 1.8 0.110000 29.460903 0.0
279166 5411788003377 Soya drink Natural Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 167.0 0.8 2.0 0.100076 29.460903 0.0
245393 3596710307555 Boisson au soja nature Bio Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 176.0 2.9 1.8 0.080000 29.460903 0.0
245395 3596710307579 Boisson au Soja Saveur Vanille Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E407 - Carraghénanes,E415 - Gomme xanthane 249.0 5.6 2.1 0.050000 29.460903 0.0
210737 3256223377383 Boisson au soja chocolat Bio - 1 litre- U bio Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E407 - Carraghénanes,E415 - Gomme xanthane 320.0 9.4 2.1 0.180086 29.460903 0.0
210742 3256223377437 Boisson au Soja nature Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 171.0 1.4 4.2 0.020000 29.460903 0.0
210743 3256223377444 Boisson au Soja Vanille Bio - 1 litre - U bio Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E407 - Carraghénanes,E415 - Gomme xanthane 247.0 5.6 2.1 0.050800 29.460903 0.0

Produits salés¶

01020304050607005001000150020002500300035004000
salt_100gcount
plotly-logomark
01020304050607080
nutrition_grade_frabcdesalt_100g
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g
150046 812475012255 Allure Mango Boissons,Boissons sucrées e NaN 293.000000 18.000000 0.000000 76.200000 29.460903
316763 8850367990924 Coconut Milk Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... e E330 - Acide citrique 757.000000 1.000000 17.000000 38.100000 29.460903
193253 3092718605360 Sirop de Cassis Boissons,Sirops,Sirops aromatisés,Sirops de cassis,Boissons sucrées e E330 - Acide citrique,E300 - Acide ascorbique 1435.000000 84.500000 0.100000 30.000000 29.460903
280984 5601144816011 Spéciale Réserve Porto Boissons,Boissons alcoolisées,Vins,Vins mutés,Vins doux,Vins mutés de type v... e NaN 669.000000 7.760000 0.000000 22.860000 29.460903
229510 3379140600775 Boisson au lychee Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... e E330 - Acide citrique,E300 - Acide ascorbique 201.000000 11.800000 0.148571 15.000000 25.200000
257363 4002631024222 AC/DC German Beer Boissons,Boissons alcoolisées,Bières,Bières blondes c NaN 157.857143 1.050000 0.033333 12.700000 29.460903
185828 27001196 Iced Tea Perzik Boissons,Thés glacés,Boissons non sucrées e NaN 25.000000 6.000000 0.077419 5.000000 10.100000
316760 8850367900244 Lait de coco Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... c E330 - Acide citrique 268.000000 1.815385 6.000000 2.850088 29.460903
316748 8850344200206 lait de coco Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... c E466 - Carboxyméthylcellulose,E471 - Mono- et diglycérides d'acides gras ali... 614.866667 1.815385 14.300000 2.850088 29.460903
314890 8713576114102 Kokosnuss milch Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... c NaN 614.866667 1.815385 14.300000 2.850088 29.460903

Recherche de produits par nutri-score et un critère¶

code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g additives_n
291604 7613032637781 Booster saveur vanille Compléments alimentaires a E333 - Citrates de calcium,E340 - Orthophosphates de potassium,E345 - Citrat... 840.0 7.00 7.00 0.24000 37.960436 15.0
305813 80872146 Chewing gum Pure Fresh Haleine Pure parfum Fresh Mint Snacks sucrés,Confiseries,Chewing-gum a E967 - Xylitol,E420 - Sorbitol,E421 - Mannitol,E965 - Maltitol,E951 - Aspart... 726.0 0.00 0.00 0.00000 41.107627 15.0
224604 3308650721700 queue de crevettes Torpedo Produits de la mer,Surgelés,Crustacés,Crevettes a E170 - Carbonate de calcium,E516 - Sulfate de calcium,E300 - Acide ascorbiqu... 862.0 0.00 10.40 0.29200 37.960436 15.0
302681 8003440969182 Pure Black 3 Menthe Reglisse Snacks sucrés,Confiseries,Chewing-gum,Chewing-gum sans sucres a E965 - Maltitol,E421 - Mannitol,E967 - Xylitol,E420 - Sorbitol,E968 - Érythr... 596.0 0.00 1.10 0.00000 41.107627 15.0
302684 8003440973844 Pure Fresh parfum Fresh Mint au Thé vert Snacks sucrés,Confiseries,Chewing-gum a E967 - Xylitol,E420 - Sorbitol,E421 - Mannitol,E965 - Maltitol,E951 - Aspart... 732.0 0.00 0.00 0.00000 41.107627 15.0
239517 3560070783038 Poulet Curry Sandwichs,Wrap a E450i - Pyrophosphate de sodium acide,E296 - Acide malique,E471 - Mono- et d... 804.0 2.20 6.50 1.01600 0.000000 13.0
242104 3564700511466 Plaisir & Gourmandise Bacon Crudités Mayonnaise allégée Sandwichs,Sandwichs garnis de charcuteries,Sandwichs au bacon a E471 - Mono- et diglycérides d'acides gras alimentaires,E472e - Ester Monoac... 924.0 1.80 10.60 1.50000 0.000000 13.0
245489 3596710322411 Spécialité Laitière aux Fruits avec morceaux Produits laitiers,Yaourts,Yaourts aux fruits,Yaourts allégés en matière grasse a E441 - Gélatine animale,E440 - Pectines,E412 - Gomme de guar,E120 - Acide ca... 174.0 4.60 0.10 0.16000 9.690426 12.0
197275 3175681075320 Mon repas à boire Gerlinea saveur chocolat Repas-minceur a E460 - Celluloses,E466 - Carboxyméthylcellulose,E407 - Carraghénanes,E331 - ... 417.0 9.75 2.50 0.19900 37.960436 12.0
216894 3263859494810 Poulet rôti crudités Maxi Sandwichs,Sandwichs à la volaille,Sandwichs au poulet a E471 - Mono- et diglycérides d'acides gras alimentaires,E282 - Propionate de... 770.0 2.90 5.10 1.20000 0.000000 12.0
227670 3350033037472 Lentilles au saumon fumé et sauce gravlax Aliments et boissons à base de végétaux,Aliments d'origine végétale,Frais,Lé... a E222 - Bisulfite de sodium,E412 - Gomme de guar,E415 - Gomme xanthane,E407 -... 644.0 1.50 7.60 1.30048 49.299153 12.0
246702 3596710401659 Yaourts (0 % MG) Pêche, Ananas, Pomme, Pruneau Frais,Produits laitiers,Desserts,Yaourts,Yaourts aux fruits,Yaourts brassés ... a E1200 - Polydextrose,E14XX - Amidons modifiés,E407 - Carraghénanes,E440 - Pe... 202.0 4.88 0.08 0.12800 9.100000 12.0

Recherche du score du produit en fonction de sa teneur en graisse et sucre¶

020406080100120140050010001500
Nutri-Scoreabcdecarbohydrates_100genergy-from-fat_100g
plotly-logomark

Etude du nutriscore en fonction de 2 paramètres¶

Gras et salé¶

<seaborn.axisgrid.FacetGrid at 0x7f3171c87e80>

 Teneur en Magnesium et Phosphore¶

0510152025303540012345678
Nutri-Scoreabcdemagnesium_100gphosphorus_100g
plotly-logomark

Teneur en sel et sodium¶

On voit que les variables sont liées, on effectue une regression linéaire pour trouver le coef

Teneur en sel = 2.526152842219576 x celle en sodium... et b= -0.002321326270485341  proche de 0

Score en fonction de la teneur en sel¶

−10010203040020406080100120140
Nutri-Scoreabcdenutrition-score-fr_100gsalt_100g
plotly-logomark

Score en fonction de la teneur en sucre¶

020406080100−10010203040
Nutri-Scoreabcdesugars_100gnutrition-score-fr_100g
plotly-logomark

Score en fonction de la teneur en graisses saturées¶

020406080100120140−10010203040
Nutri-Scoreabcdesaturated-fat_100gnutrition-score-fr_100g
plotly-logomark

Score en fonction de l'energie¶

0500100015002000250030003500−10010203040
Nutri-Scoreabcdeenergy_100gnutrition-score-fr_100g
plotly-logomark

Association nutriscore lettre / score numérique¶

Analyse d'un champ par catégorie de produits (ANOVA)¶

Correlation : 0.2240350053327589
051015202530ChocolatsBonbonsSnacks sucrésSoupesEpicerieFromagesProduits à tartiner salésGâteauxChips et fritesPâtes alimentairesDessertsPetit-déjeunersPlats à base de viandeSurgelésBoissonsPainsBiscuitsPlats préparésConservesAliments et boissons à base de végétaux
additives_nCatégories
plotly-logomark
<function __main__.anova_by_category(column)>

Etude des boissons peu sucrée et riche en fruits / légumes¶

4429  produits
Jusqu'à  94.0  g de sucres
Jusqu'à  11.0  additifs
020406080020406080100
nutrition_grade_frabcdeSucre (100g)Teneur en fruits et légumes
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g
245240 3596710259151 Tomate, Pur Jus (Salé) Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... b NaN 86.000 3.500 0.100 0.630000 100.000000
278100 5410188014211 Pure Premium Tomate Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... b NaN 71.000 3.200 0.000 1.524000 100.000000
254905 3760225491225 100% pur jus tomate Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... b NaN 70.000 2.700 0.500 0.400000 100.000000
255640 3800014284284 Fresh 100% juice tomato Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... c NaN 75.625 3.125 0.275 0.593500 100.000000
250790 3700749300177 Jus de Tomate Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... c NaN 75.625 3.125 0.275 0.593500 100.000000
213521 3258561301129 Jus de tomate Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... c NaN 75.625 3.125 0.275 0.593500 100.000000
222481 3281780878905 Smoothie multilégume & fruits Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... d NaN 105.000 4.500 0.500 0.630000 100.000000
253860 3760132081991 Concombre Avocat Poire Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... d NaN 139.000 4.400 0.900 0.030000 80.000000
253859 3760132081960 Kale Brocoli Kiwi Aliments et boissons à base de végétaux,Boissons,Boissons à base de végétaux... c NaN 101.000 4.300 0.200 0.030000 60.000000
216342 3263857092018 Citron spécialité à diluer Boissons,Sirops,Sirops aromatisés,Sirops de citron,Boissons non sucrées,Bois... c NaN 91.000 1.030 0.000 0.007620 41.000000
279166 5411788003377 Soya drink Natural Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 167.000 0.800 2.000 0.100076 29.460903
245393 3596710307555 Boisson au soja nature Bio Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 176.000 2.900 1.800 0.080000 29.460903

Etude des chocolats peu sucrés et avec peu de graisses saturées¶

Jusqu'à  83.0  g de sucres
Jusqu'à  16.0  additifs
Jusqu'à  41.0  g de graisses saturées
Erreur lors de la lecture de cette url : nan
Erreur lors de la lecture de cette url : nan
Erreur lors de la lecture de cette url : nan
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g cocoa_100g additives_n labels
213740 3258590001373 Chocolat noir 95 % Snacks sucrés,Chocolats,Chocolats noirs d NaN 2641.0 7.6 51.800000 0.10000 30.000000 95.00000 0.0 Peu ou pas de sel,Sans gluten,Sans sel ajouté,AB Agriculture Biologique,Vega...
218183 3266191104072 Chocolat Noir 72% de Cacao Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin d NaN 2339.0 16.0 45.000000 0.01000 26.102345 72.00000 0.0 Peu ou pas de sucre,Peu de sucre,Bio,Bio européen,Allégé en sucre,CH-BIO-006...
315648 8718421151738 Organic Raw Chocolate Amande/Figue Snacks sucrés,Chocolats,Chocolats avec amandes,Chocolats noirs,Chocolats noi... e NaN 2454.0 17.8 46.100000 0.12000 26.102345 80.00000 0.0 Bio,Végétarien,Bio européen,Végétalien,NL-BIO-01,Agriculture UE/Non UE,Sans ...
241430 3564700257647 Esprit Noir 85% de Cacao Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin d NaN 2364.0 15.9 43.400000 0.02000 26.102345 85.00000 0.0 Pur beurre de cacao
254325 3760170551401 Chocolat Noir à la banane Snacks sucrés,Chocolats,Chocolats noirs,en:Chocolats-noirs-extra-fin c NaN 2413.0 11.0 46.000000 0.02000 26.102345 65.00000 0.0 No flavors,No lecithine,Nature & Progrès
251727 3760027470220 Chocolat Noir 80 % Snacks sucrés,Chocolats,Chocolats noirs d NaN 2218.0 14.0 37.548333 0.08000 30.000000 80.00000 0.0 Bio,Bio européen,FR-BIO-01,AB Agriculture Biologique,Fairtrade
191250 3046920029971 Excellence 85% Cacao Noir Puissant Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin e NaN 2210.0 14.0 46.000000 0.08000 26.102345 85.00000 0.0 NaN
191304 3046920057721 Excellence 85% Cacao Noir Puissant (offre gourmet) Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin e NaN 2210.0 14.0 46.000000 0.08000 26.102345 85.00000 0.0 NaN
191206 3046920022606 Chocolat Noir 85% Cacao Snacks sucrés,Chocolats,Chocolats noirs,en:Chocolats-noirs-extra-fin e NaN 2413.0 11.0 46.000000 0.02000 26.102345 85.00000 0.0 NaN
191233 3046920027953 Excellence 85% Cacao Noir Puissant LOT de 2 Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin e NaN 2210.0 14.0 46.000000 0.08000 26.102345 63.78125 0.0 NaN
191225 3046920027649 Excellence 85% Cacao Noir Puissant Snacks sucrés,Chocolats,Chocolats noirs,Chocolats noirs extra fin e NaN 2210.0 14.0 46.000000 0.08001 26.102345 85.00000 0.0 NaN
226819 3347437002045 Chocolat noir intense Snacks sucrés,Chocolats,Chocolats noirs d NaN 2473.0 11.7 47.400000 0.02000 0.000000 85.00000 0.0 Organic, EU Organic, fr:AB Agriculture Biologique

Produits du petit déjeuner¶

Sans additifs et faibles en sucre

code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g fiber_100g
234862 3477730009011 Cacao maigre en poudre Petit-déjeuners,Snacks sucrés,Chocolats,Chocolats en poudre b NaN 1395.0 1.0 11.0 0.04826 10.927833 30.0
253500 3760121210227 Cacao maigre en poudre Petit-déjeuners,Snacks sucrés,Chocolats,Chocolats en poudre a NaN 1275.0 2.0 11.0 0.17000 10.927833 27.5
234903 3478820008006 Muesli sans sucres ajoutés Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1592.0 9.5 10.7 0.02540 22.900000 18.4
251400 3760020503802 Muesli aux graines gourmandes Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1592.0 9.5 10.7 0.03000 22.900000 18.4
201481 3222475651298 Flocons d'avoine complets Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1525.0 4.2 7.9 0.00000 10.927833 16.0
232102 3421557910173 Flocons 5 Céréales Complets Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1414.0 1.8 3.2 0.01000 10.927833 14.4
238649 3560070519309 Muesli floconneux 5 céréales nature Bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1397.0 1.8 3.2 0.01000 22.900000 14.0
210202 3256221407242 Flocons d'avoine bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1501.0 1.0 6.5 0.00000 10.927833 12.0
238289 3560070407613 Flocon d'avoine Bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1460.0 1.0 6.5 0.03000 0.000000 12.0
220767 3273120011165 Petits flocons d'avoine Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1577.0 1.0 7.1 0.01000 10.927833 11.5
220760 3273120010731 Gros Flocons d'Avoine Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1589.0 1.0 7.1 0.01000 10.927833 11.5
220870 3273120026428 petit flocons d'avoine Aliments et boissons à base de végétaux,Aliments d'origine végétale,Petit-dé... a NaN 1589.0 1.0 7.1 0.01000 10.927833 11.5

Pâtes¶

228  Produits
Jusqu'à  2.0  g de sel
Jusqu'à  0.0  additifs
Jusqu'à  10.4  g de graisses sat
Jusqu'à  5.8  g de graisses sat
0123456dcba
Nutri-scoreabcdTeneur en graisses saturées pour 100gNutri-score
plotly-logomark
05101520dcba
Nutri-scoreabcdTeneur en fibres pour 100gNutri-score
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g
285436 7340084860132 Fettuccine sans gluten Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1352.0 11.500000 4.000000 0.01524 9.621429
225235 3329489521156 Spirales de Blé Khorasan Kamut Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1427.0 3.500000 3.000000 0.02000 9.621429
218493 3267460030214 Torsade Lentilles Corail Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1397.0 1.900000 3.175307 0.02000 9.621429
227520 3350031904387 Farfalle au Blé Integral Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1461.0 3.100000 2.100000 0.02000 9.621429
279182 5411788037167 Penne Kamut khorasan Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1413.0 4.000000 1.200000 0.01000 9.621429
305033 8032891769294 Coquillette complète Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1510.0 3.800000 6.688889 0.08000 9.621429
305031 8032891769270 Spaghetti complet Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1510.0 3.800000 3.175307 0.08000 9.621429
217980 3266191012308 Pâtes complètes, Spaghetti Bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1453.0 5.000000 2.700000 0.00600 9.621429
245856 3596710347209 Spaghetti au blé entier Bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1454.0 3.000000 2.200000 0.02000 9.621429
303402 8007290335005 Pâtes alimentaires de qualité supérieure de blé entier BIOLOGIQUE Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1487.0 3.400000 2.400000 0.00000 9.621429
218504 3267460030689 Nids au Petit Épeautre Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... c NaN 1607.0 3.164839 1.750000 0.07620 9.621429
263422 4104420063204 Spaghetti complète Bio Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 1449.0 4.300000 1.900000 0.00000 9.621429

Laits (Bio)¶

Nous manquons d'omega 3 et consommons trop d'omega 6 dans notre alimentation... Privilègions un type de lait :

  • riche en omega-3
  • avec le moins de graisses saturées
102030405060051015200.020.040.060.080.1
20406080100120saturated-fat_100gomega-3-fat_100g
plotly-logomark
code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g omega-3-fat_100g omega-6-fat_100g
254259 3760166430123 Lait de jument pasteurisé Produits laitiers,Laits,Lait-de-jument c NaN 205.0 6.664715 1.2 0.050800 0.0 0.110000 0.12
255391 3770002743034 lait frais entier pasteurisé Produits laitiers,Laits,Laits frais,Laits entiers c NaN 308.0 6.664715 4.3 0.155077 0.0 0.060000 0.12
210487 3256222242644 Lait entier stérilisé UHT issu de l'agriculture biologique Produits laitiers,Laits,Homogenized milks,Pasteurised milks,Laits UHT,Laits ... b NaN 268.0 4.800000 3.6 0.100000 0.0 0.037000 0.12
232463 3428272970161 Lait Bio Entier Produits laitiers,Laits,Homogenized milks,Pasteurised milks,Laits UHT,Laits ... b NaN 269.0 4.800000 3.6 0.110000 0.0 0.035500 0.12
207313 3250391815265 Lait entier stérilisé UHT bio Produits laitiers,Laits,Homogenized milks,Pasteurised milks,Laits UHT,Laits ... b NaN 269.0 4.800000 3.6 0.130000 0.0 0.035500 0.12
243423 3564707096065 Lait Entier stérilisé UHT Produits laitiers,Laits,Homogenized milks,Pasteurised milks,Laits UHT,Laits ... b NaN 269.0 4.800000 3.6 0.127000 0.0 0.035500 0.12
285498 7394376615955 Oatlty avoine calcium bio Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a E330 - Acide citrique 190.0 4.000000 1.5 0.100000 0.0 0.020319 0.12
243414 3564707095723 Boisson au Soja Nature Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 154.0 0.700000 1.8 0.010000 0.0 0.020319 0.12
197304 3175681100787 Boisson Soja du Sud-Ouest Nature Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 170.0 0.700000 2.1 0.030000 0.0 0.020319 0.12
217879 3266191005508 Boisson de soja Aliments et boissons à base de végétaux,Boissons,Produits laitiers,Boissons ... a NaN 211.0 3.200000 2.1 0.127000 0.0 0.020319 0.12
202424 3229820181424 Noisette Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 222.0 4.200000 2.7 0.130000 0.0 0.020319 0.12
202347 3229820019604 Boisson de Soja Nature BIO Aliments et boissons à base de végétaux,Boissons,Aliments d'origine végétale... a NaN 178.0 1.000000 2.5 0.101600 0.0 0.020319 0.12

Quels sont les bons plats préparés ?¶

code product_name categories_fr nutrition_grade_fr additives_fr energy_100g sugars_100g fat_100g salt_100g fruits-vegetables-nuts_100g
213801 3259010301103 Croc tofu - Ail & Fines herbes Aliments et boissons à base de végétaux,Aliments d'origine végétale,Plats pr... a E516 - Sulfate de calcium,E511 - Chlorure de magnésium,E412 - Gomme de guar 731.0 1.0 9.2 1.00000 38.494011
254743 3760209680041 Pizza 3 fromages Plats préparés,Pizzas tartes salées et quiches,Pizzas c NaN 1218.0 1.0 7.5 0.30000 38.494011
213806 3259010301608 Croc tofu aux algues de Bretagne Aliments et boissons à base de végétaux,Aliments d'origine végétale,Plats pr... a E516 - Sulfate de calcium,E511 - Chlorure de magnésium 619.0 0.5 8.2 0.95000 12.100000
213791 3259010101512 Tofou aux Herbes Aliments et boissons à base de végétaux,Aliments d'origine végétale,Légumine... a E511 - Chlorure de magnésium 558.0 0.8 7.9 0.64000 38.494011
213829 3259011047765 Tofou au Curry Plats préparés a E511 - Chlorure de magnésium,E160c - Extrait de paprika 588.0 0.7 8.6 0.72898 38.494011
254741 3760209680027 Pizza pâte fine au feu de bois Margarita Plats préparés,Pizzas tartes salées et quiches,Pizzas b NaN 1266.0 1.0 5.0 0.50000 38.494011
254740 3760209680010 Pizza Royale Les P'tits Chefs du Bio Plats préparés,Pizzas tartes salées et quiches,Pizzas b E509 - Chlorure de calcium 1054.0 1.0 8.0 0.30000 38.494011
243297 3564707082082 Lentilles tofu Aliments et boissons à base de végétaux,Aliments d'origine végétale,Légumine... a E511 - Chlorure de magnésium,E412 - Gomme de guar,E415 - Gomme xanthane 591.0 0.5 7.2 0.77800 38.494011
251522 3760020508883 Lentilles façon petit salé Plats préparés a E300 - Acide ascorbique 487.0 0.6 2.0 0.75000 38.494011
202433 3229820188744 Quinoa Lentilles Bio - 250 g - Bjorg Aliments et boissons à base de végétaux,Aliments d'origine végétale,Céréales... a NaN 675.0 0.1 2.8 1.01600 38.494011
202643 3229820791784 Les délicieux Palets Soja et petits Légumes Aliments et boissons à base de végétaux,Aliments d'origine végétale,Plats pr... a E414 - Gomme d'acacia 631.0 1.0 8.0 0.77000 32.100000
213893 3259011169672 Galettes savoyarde Aliments et boissons à base de végétaux,Aliments d'origine végétale,Plats pr... b NaN 947.0 0.6 7.2 1.10000 38.494011

ACP : Recherche des composantes principales¶

Recherche de correlations

  • sel & sodium (comme vu plus haut)
  • sucrose, glucose, carbohydrates
  • fat, energy from fat, energy

Le premier plan factoriel concentre 25% de l'information

Perform our PCA on quantitaive variables (100g)

Remove duplicates variables